import sys
sys.path.append("..")
from database.db_handler import MysqlHander
from common.my_http import MyHttp
import urllib.request
from bs4 import BeautifulSoup
from common.entity_data import EntityData
import glob
import jieba
import re
import threading
import hashlib

'''
法院
'''

class FayuanData:
    def __init__(self):
        self.entity = EntityData()
        self.diqu = {u"安徽":u"安徽地区法院",u"北京":u"北京地区法院",u"重庆":u"重庆地区法院",u"福建":u"福建地区法院",u"广东":u"广东地区法院",u"广西":u"广西地区法院",u"贵州":u"贵州地区法院",u"甘肃":u"甘肃地区法院",u"海南":u"海南地区法院",u"河南":u"河南地区法院",u"湖北":u"湖北地区法院",u"湖南":u"湖南地区法院",u"河北":u"河北地区法院",u"黑龙江":u"黑龙江地区法院",u"江苏":u"江苏地区法院",u"江西":u"江西地区法院",u"吉林":u"吉林地区法院",u"辽宁":u"辽宁地区法院",u"内蒙古":u"内蒙古地区法院",u"宁夏":u"宁夏地区法院",u"青海":u"青海地区法院",u"陕西":u"陕西地区法院",u"四川":u"四川地区法院",u"上海":u"上海地区法院",u"山西":u"山西地区法院",u"山东":u"山东地区法院",u"天津":u"天津地区法院",u"新疆":u"新疆地区法院",u"西藏":u"西藏地区法院",u"云南":u"云南地区法院",u"浙江":u"浙江地区法院"}
        self.diqu_fayuan = {u"中国大陆地区法院":""}
        pass
    
    def lvsuo(self, page):
        url = "https://www.lawxp.com/court/?pg=" + str(page) + "&rid=0&cid=0&q="
        bs4_data = MyHttp.bs4_utf8_data(url)
        for ul in bs4_data.find_all(name="ul", attrs={'class':'w-zx-gdwt2 w-zx-dq7'}):
            for valid_data in ul.find_all(name="div", attrs={'class':'w-zx-sfcs4'}):
                #print(str(valid_data))
                title_data = valid_data.find("a").text.replace(u" ","").replace("\n","")
                for key,value in self.diqu.items():
                    if re.search(key, title_data):
                        if value in self.diqu_fayuan.keys():
                            self.diqu_fayuan[value] = self.diqu_fayuan[value] + "|" + title_data
                        else:
                            self.diqu_fayuan[value] = title_data
                        self.diqu_fayuan[u"中国大陆地区法院"] = self.diqu_fayuan[u"中国大陆地区法院"] + "|" + title_data
                print(title_data)
                #self.macro.add_macro_data(date_data, 100, title_data, url_data, "中国财政部")


    
    def get_data(self):
        for i in range (1, 362):
            self.lvsuo(i)
        for key,value in self.diqu_fayuan.items():
            #print(key + ":" + value)
            self.entity.add_entity_data(key, "", 101, 1010001, "", "", value)
            self.entity.update_entity_data(key, "", 101, 1010001, "", "", value)

def fayuan_api():
    d = FayuanData()
    d.get_data()

if __name__ == '__main__':
    fayuan_api()
